[Home] AI로 돌아가기

Vector DB (벡터 데이터베이스)

벡터 데이터베이스(Vector DB)는 데이터를 벡터 형태로 저장하고 유사한 데이터를 빠르게 검색하는 데 최적화된 데이터베이스다. 주로 자연어 처리(NLP), 이미지 검색, 추천 시스템 등에서 활용된다.

목차

1. Vector DB란?

Vector DB는 데이터의 특징을 벡터 형태로 변환하여 저장하고, 벡터 간의 거리 계산을 통해 유사한 데이터를 검색하는 방식의 데이터베이스다. 기존의 관계형 데이터베이스(RDBMS)와 달리, 복잡한 다차원 데이터 검색에 적합하다.

2. Vector DB의 활용

3. 유사도 측정 방법

Vector DB에서는 벡터 간의 유사도를 측정하여 검색 결과를 반환한다. 대표적인 유사도 측정 방법은 다음과 같다.

4. Vector DB의 예제

구글에서 개발한 BERT(Bidirectional Encoder Representations from Transformers) 모델은 텍스트를 786차원의 벡터로 변환하여 유사한 문장을 검색할 수 있도록 한다.